国产精品久久无码一区-精品国产偷窥一区二区-欧亚欧洲码国产-欧美乱人伦人妻中文字幕-国产av无码国产av毛片

咨詢熱線:

185-9527-1032

聯系QQ:

2863379292

官方微信:

AI驅動的電商「用戶模型」:如何確定用戶的「購物性別

建站經驗

導讀:開搶了!雙11創業者優選服務!我們經常談論的用戶精細化運營,到底是什么?簡單來講,就是將網站的每個用戶標簽化,制作一個屬于他自己的網絡身份證。然后,運營人員通過身份證來確定活

發表日期:2019-08-04

文章編輯:興田科技

瀏覽次數:11641

標簽:

開搶了!雙11創業者優選服務!

我們經常談論的用戶精細化運營,到底是什么?簡單來講,就是將網站的每個用戶標簽化,制作一個屬于他自己的網絡身份證。

然后,運營人員通過身份證來確定活動的投放人群,圈定人群范圍,更為精準的用戶培養和管理。

當然,身份證最基本的信息就是姓名、年齡和性別。與現實不同的是,網絡上用戶填寫的資料不一定完全準確,還需要進行進一步的確認和評估。

下面我來介紹一下具體的識別思路。

AI驅動的電商「用戶模型」:如何確定用戶的「購物性別 怎么學習做網站

一、用戶畫像需要的數據

用戶平時在電商網站的購物行為、瀏覽行為、搜索行為,以及訂單購買情況都會被記錄在案,探查其消費能力,興趣等。數據歸類后,一般來講,可以通過三類數據對用戶進行分群和定義。

AI驅動的電商「用戶模型」:如何確定用戶的「購物性別 怎么學習做網站

1、用戶信息

社會特征:馬克思的人性觀把人分為社會屬性和自然屬性。社會特征主要指的是人在社會上的階級屬性,當然也包括服從性、依賴性或者自覺性等,這是人類發展的必然的基本要求。

自然特征:也可以說成是人的生物性,通常來講可以是食欲,物欲或者購買欲,自我保存能力。但不同人會有不同的自然特征,比如學習能力和邏輯思維等。

興趣特征:對于電商來講,主要是對某件商品,某個品牌或者品類的興趣程度,如加購、瀏覽、收藏、搜索和下單行為。

消費特征:消費能力的評估,消費傾向的評估,能夠判斷用戶的消費層級,是高消費力還是低消費力。

2、商品

商品屬性:基本信息,品類,顏色尺碼型號等。

商品定位:商品層級,是否為高中低端,商品類型傾向于哪類客戶,區域或者其他的特征。

最后通過以上的信息來獲取用戶信息,判斷其具體的畫像特征,然后得到類似于醬紫的網絡身份證。

AI驅動的電商「用戶模型」:如何確定用戶的「購物性別 怎么學習做網站

通常,拿到數據后,我們會將每個環節進行拆解,落實到具體的行動策略上。大體可以根據以下流程進行模型的預估:

AI驅動的電商「用戶模型」:如何確定用戶的「購物性別 怎么學習做網站

業務目標:精準投放——針對已有產品,尋找某性別偏好的精準人群進行廣告投放。

技術目標:對用戶購物性別識別——男性,女性,中性。

解決思路:選擇一種分類算法,建立spark模型,對模型進行應用。

線上投放:對得到的數據進行小范圍內的測試投放,初期不宜過大擴大投放范圍。

效果分析:對投放的用戶進行數據分析,評估數據的準確性。若不夠完美,則需要重新建模和測試。

二、產品如何理解建模過程

重點來了,雖然能夠通過用戶的行為、購買和興趣數據,了解用戶的基本信息,但是仍然不清楚如何建模?用什么語言建模?

其實,購物性別的區分使用的是spark,但是spark也有很多分類,包含邏輯回歸,線性支持向量機,樸素貝葉斯模型和決策樹。那么,又該如何選擇呢?

其中,決策樹的優點較多,主要是其變量處理靈活,不要求相互獨立。可處理大維度的數據,不用預先對模型的特征有所了解。對于表達復雜的非線性模式和特征的相互關系,模型相對容易理解和解釋。看起來決策樹的方法最適合區分性別特征了,所以決定用決策樹進行嘗試。

什么是決策樹?簡單來講,是通過訓練數據來構建一棵用于分類的樹,從而對未知數據進行高效分類。可以從下面的圖了解決策樹的工作原理。

AI驅動的電商「用戶模型」:如何確定用戶的「購物性別 怎么學習做網站

構造決策樹的步驟為:

起始階段,所有歷史數據當作一個主節點;

我們選擇某個屬性測試條件用于分割節點,以擇偶標準模型為例,把長相作為首節點;

將長相節點分割,以帥和丑作為條件,導致的結果作為其子節點,如分割成牽手和是否公務員;

對子節點,如牽手和是否公務員,繼續執行第2、3步,直到節點滿足停止分割的條件。

通過訓練數據來構建一棵用于分類的樹,從而對未知數據進行高效分類。

以上步驟中,能夠得出一個結論,在構建決策樹的過程中,最重要的是如何找到最好的分割點。決策樹值得注意的問題是過擬合問題,整個算法必須解決「如何停止分割」和「如何選擇分割」兩個關鍵問題。

最簡單的做法就是設定樹的深度或枝葉的最少樣本量。但是,過少的樣本量又不具有代表性,所以一般情況,可以使用交叉驗證的方法。交叉驗證就是可以使用一部分數據用于模型的訓練,另一部分數據可以用來評估模型的性能。業內常用的劃分方法是講樣本進行50/50分,60/40分或者80/20分。

三、模型確立過程

在建模前期,首要考慮的事情就是先確定指標,以及對樣本的定義。購物性別指的是什么?通過哪些數據來確定購物性別,樣本的準確性,如何驗證數據的可信度等。

四、購物性別的定義

先看下圖,具體的邏輯可從圖中查看。一般來講,用戶填寫的資料不一定真實,我們對他/她的性別數據持懷疑態度,所以,就需要其他數據進行輔助證明其性別。

訂單數據能夠真實反映用戶的購買心態,預測購買行為,并且能夠通過購買商品的所屬類別,判斷用戶的購買傾向,最后得到性別特征類目。不過本文就不展開探討甄別特征類目的區分方法了。

AI驅動的電商「用戶模型」:如何確定用戶的「購物性別 怎么學習做網站

根據數據結果,最終,確認了購物性別的定義。分為:

購物性別男:N月購買的男性特征類目子下單數> N月購買的女性特征類目子下單數;

購物性別女:N月購買的男性特征類目子下單數> N月購買的女性特征類目子下單數;

購物性別中性:未下單男女特征類目。

N需要具體根據業務場景來定。

五、建模數據準備過程

本節是具體的操作過程,模型的實操階段。一般來講,不同模型的訓練其實大體雷同。從技術上來講,各家算法大多使用spark,不同點是所運算的模型都是針對于場景來定的。

AI驅動的電商「用戶模型」:如何確定用戶的「購物性別 怎么學習做網站

在全部樣本中,取80%的數據用于訓練模型;

在全部樣本中,取20%的數據用戶數據測試。

這種方式可以更好的根據數據的規模,提高模型的準確性。

六、模型效果分析

根據各類參數的評估結果,以及人工經驗選定的模型參數,建立模型。值得注意的是,決策樹的深度不要過深,以防止過擬合的問題:

AI驅動的電商「用戶模型」:如何確定用戶的「購物性別 怎么學習做網站

行業內當前采用數據挖掘、機器學習和推薦系統中的評測指標:準確率(precision)、召回率(Recall)。準確率是應用最廣的數據指標,也很清晰易懂,以男性為例:

準確率=命中的男性用戶數量/所有預測男性數量,一般來講,準確率可以評估模型的質量,他是很直觀的數據評價,但并不是說準確度越高,算法越好。

召回率=命中的男性用戶數量/所有男性數量,反映了被正確判定的正例占總的正例的比重。

模型建立完后,需根據模型的結果與預期的對比,進行調優。

七、最后要說的

購物性別定義對于用戶精準營銷十分重要,疑難雜癥,對癥下藥,才能出現更好的療效。

相關推薦

更多新聞